Q-learning

标签： python

Q-learning原理即代码实现

强化学习——Q-Leaning算法原理

标签：算法

是用在决策上的一个策略，以概率ε选择随机动作，以概率1-ε选择当前最优动作，比如epsilon = 0.9的时候，就说明百分之90的情况我会按照Q表的最优值选择行为，百分之10的时间随机选择行为。alpha：学习率，决定这次...

Q-Learning算法 Matlab代码实现

标签： Q-learning M

一个简单的Q-Learning算法的综合示例，可以在Matlab仿真平台上实现。

【机器学习】Q-Learning详细介绍

标签：机器学习人工智能算法

Q-learning 是一种机器学习方法，它使模型能够通过采取正确的操作来迭代学习和改进。 Q-learning属于强化学习的算法

强化学习算法-基于python的Q学习算法q-learning实现

标签： python 算法学习源码软件开发语言

强化学习算法-基于python的Q学习算法q-learning实现

Q-Learning 原理干货讲解

标签： python Q-Learning 强化学习

强化学习基于环境的反馈而行动，通过不断与环境的交互、试错，最终完成特定目的或者使得行动收益最大化。强化学习不需要训练数据，但是它需要每一步行动环境给予的反馈，是奖励还是惩罚，反馈可以量化，基于反馈不断...

Q-learning

标签：人工智能机器学习算法

Q-learning是强化学习中的一种重要算法，它通过与环境的交互学习到一个最优策略，使得累积奖励最大化。Q-learning算法不需要事先知道环境的状态转移概率和奖励函数，因此适用于许多实际问题。需要注意的是，Q-...

Deep-Q-Learning-Deep-SARSA-LunarLander-v2:将深度强化学习算法Deep SARSA和Deep Q-Learning应用于OpenAI ...

标签： machine-learning reinforcement-learning machine-learning-algorithms deep-reinforcement-learning reinforcement-learning-algorithms JupyterNotebook

深度SARSA和深度Q学习-LunarLander-v2 环境在这个项目中，我试图从OpenAI体育馆解决Lunar Lander环境。这是一个二维环境，其目的是教导登月舱模块安全地着陆在固定在点（0,0）的着陆垫上。该代理具有3个推进器：一...

Q-learning_Q-learning_Q-Learningpython_DEMO_

标签： Q-learning Q-Learningpython DEMO

了解Q-learning的基本概念及流程。这里只是一个简单的demo

打击迹线的matlab代码-The-Mean-Squared-Error-of-Double-Q-Learning:双Q学习的均方误差

标签：系统开源

Q-learning 和 Q-learning。以下所有实验均使用 Matlab R2018b 和 Python 3.6.9 运行我们考虑的环境贝尔德的例子：贝尔德 GridWorld：网格 CartPole：手推车最大化偏差：偏差，偏差（nn）贝尔德的实验文件： ...

【提供操作视频】基于Q-learning强化学习的H无穷控制器设计matlab仿真

标签： Q-learning 强化学习 H无穷控制器 matlab仿真

1.领域：matlab，Q-learning强化学习的H无穷控制器算法 2.内容：【提供操作视频】基于Q-learning强化学习的H无穷控制器设计matlab仿真 3.用处：用于Q-learning强化学习的H无穷控制器算法编程学习 4.指向人群：本...

Q-Learning 源代码及注释(matlab).doc

标签：强化学习

基于王子寻找公主的案例详细解释Q-Learning算法的每一条代码

可直接运行基于MATLAB实现的机器人Q-Learning路径规划算法动态仿真设置起点和终点动态图形显示程序源...

标签： matlab 算法源码软件开发语言

基于MATLAB实现的机器人Q-Learning路径规划算法动态仿真设置起点和终点动态图形显示运行PathPlanning代码后，图形GUI界面设置起点和终点，还可以设置障碍，然后开始路径规划，可以动态绘制路线，最终从起点到达...

使用 Q-learning 在能源市场中的收益最大化：使用 Q-学习算法在能源市场中的收益最大化-matlab开发

标签： matlab

使用 Q-learning 算法在能源市场中实现利益最大化这篇论文有一些想法： Yousefi, S.、Moghaddam, MP 和 Majd, VJ (2011)。使用综合需求响应模型在基于代理的零售市场中优化实时定价。能源，36（9），5716-5727。

自适应控制matlab仿真代码-LQR-integral-Q-learning:在Automatica11(48),2850--2859,20

标签：系统开源

意图控制matlab仿真代码LQR-积分-Q-学习该存储库提供了用于重现出版物中提供的模拟结果（图 1（a）、（d））的开源代码： “Lee、JY、Park、JB 和 Choi，YH，用于连续时间线性系统自适应最优控制的积分 Q 学习和...

迷宫求解器——Q-Learning和SARSA算法：在本项目中，我们通过Q-Learning和SARSA算法模拟了两个代理，并将...

标签： matlab

在这个项目中，我们在MATLAB实时编辑器环境中模拟了交互式迷宫环境，并实现了两种经典的Rl（强化学习）算法-Q学习和sarsa算法。通过创建一个在迷宫中交互移动的代理，可以使用两种算法来训练最高激励值奖励和最佳...

基于python的强化学习算法Q-learning设计与实现

标签： python 算法开发语言

基于python的强化学习算法Q-learning设计与实现

通过Q-learning深入理解强化学习

标签：通过Q-learning深入理解强化学习

本文来自于csdn，本文将带你学习经典强化学习算法Q-learning的相关知识，你将学到：（1）Q-learning的概念解释和算法详解；（2）通过Numpy实现Q-learning。故事案例：骑士和公主假设你是一名骑士，并且你需要拯救...

强化学习Q-Learning Python可视化代码训练智能体移动到目标点 Pygame

标签： python 软件/插件 pygame 强化学习 q-learning

本项目是一个简单的Q-learning算法在pygame环境下的实现，训练一个自主学习的智能体（agent）在一个5x5的网格环境中移动，使得智能体能够以最大概率到达目标位置。学习规则： - 智能体（蓝色圆点）可以在一个5x5的...

Hands-On-Q-Learning-with-Python:Packt发行的《动手Q-Learning with Python》

标签： Python

使用Python进行动手Q学习这是Packt出版的的代码库。使用OpenAI Gym，Keras和TensorFlow进行实用的Q学习这本书是关于什么的？ Q学习是一种机器学习算法，用于解决人工智能（AI）的优化问题。它是AI研究人员中...

Q_learning_Qlearning_Q算法_Q学习算法_Q-learning_q学习

标签： Qlearning Q算法 Q学习算法 Q-learning q学习

Q学习算法的一个基础例子可以从这上面进行修改满足自身要求

GAN-Q-Learning:实施GAN Q学习https

标签： reinforcement-learning qlearning deep-learning neural-network generative-adversarial-network gan-dqn Python

该代码实现了的“ GAN Q-Learning”算法。纸上的修改已发布的算法中有错字（以鉴别符丢失的形式）当前，似乎存在一种情况，导致鉴别器（最终）在串极环境中（甚至在学习实际分布之前）完全区别于生成器。我已经...

基于Q-Learning算法的建筑能耗预测

标签：强化学习建筑能耗预测 Q-learning 深度置信网

提出一种基于Q-learning算法的建筑能耗预测方法.通过将建筑能耗预测问题建模为一个标准的马尔科夫决策过程，利用深度置信网对建筑能耗进行状态建模，结合Q-learning算法，实现对建筑能耗的实时预测.通过美国巴尔的摩...

q-learning.rar_Q-learning_Q——learning_matlab q-learning_q learni

标签： q-learning q——learning matlab_q-learning q_learning_matlab q-learning_matlab

q-learning的一个解释性例子.压缩文件有两个m文件构成，运行后可输出结果。

Q-LEARNING 算法在控制倒立摆的应用

标签：人工智能

这是基于q学习的一个模型，是一个基于倒立摆平衡问题的解决，没有加入神经网络，只是引入一些有限的数据，有不足的地方欢迎大家批评指正，两个函数没有传上去后续补上

【强化学习】Q-Learning算法详解

标签：算法强化学习 Q-Learning

1 Q-Learning算法简介 1.1 行为准则我们做很多事情都有自己的行为准则，比如小时候爸妈常说：不写完作业就不准看电视。所以我们在写作业这种状态下，写的好的行为就是继续写作业，知道写完他，我们还可以得到奖励。...

Q-learning_q-learningmatlab_联合开发_路径规划_三维路径规划_q学习

标签： q-learningmatlab 联合开发路径规划三维路径规划 q学习

可以进行二维到三维的基于强化学习的路径规划

深度学习算法 Q-learning 原理

标签： ar IN le ng ni q-learning td 学习深度学习深度学习算法算法

Q-learning Q-learning 是 value-based 的方法，在这种方法中我们不是要训练一个 policy，而是要训练一个critic网络。critic 并不直接采取行为，只是对现有的 actor ，评价它的好坏。 Value-Fuction critic 给出...

Deep-QLearning-Agent-for-Traffic-Signal-Control:深入的Q-Learning强化学习代理尝试在交叉路口选择正确的...

标签： deep-reinforcement-learning q-learning traffic sumo traffic-signal traffic-light-controller JupyterNotebook

深入的Q-Learning强化学习代理尝试在交叉路口选择正确的交通信号灯相位以最大化交通效率的框架。我已将其上传到此处，以帮助任何人寻找通过SUMO进行深度强化学习的良好起点。这段代码是从我的硕士论文中提取的，...

边做边学深度强化学习：PyTorch程序设计实践迷宫 Q-Learning

标签：边学边做深度强化学习

边做边学深度强化学习：PyTorch程序设计实践迷宫 Q-Learning

” Q-learning“ 的搜索结果

Q-Learning

强化学习——Q-Leaning算法原理

Q-Learning算法 Matlab代码实现

【机器学习】Q-Learning详细介绍

强化学习算法-基于python的Q学习算法q-learning实现

Q-Learning 原理干货讲解

Q-learning

Deep-Q-Learning-Deep-SARSA-LunarLander-v2:将深度强化学习算法Deep SARSA和Deep Q-Learning应用于OpenAI ...

Q-learning_Q-learning_Q-Learningpython_DEMO_

打击迹线的matlab代码-The-Mean-Squared-Error-of-Double-Q-Learning:双Q学习的均方误差

【提供操作视频】基于Q-learning强化学习的H无穷控制器设计matlab仿真

Q-Learning 源代码及注释(matlab).doc

可直接运行基于MATLAB实现的机器人Q-Learning路径规划算法动态仿真设置起点和终点动态图形显示程序源...

使用 Q-learning 在能源市场中的收益最大化：使用 Q-学习算法在能源市场中的收益最大化-matlab开发

自适应控制matlab仿真代码-LQR-integral-Q-learning:在Automatica11(48),2850--2859,20

迷宫求解器——Q-Learning和SARSA算法：在本项目中，我们通过Q-Learning和SARSA算法模拟了两个代理，并将...

基于python的强化学习算法Q-learning设计与实现

通过Q-learning深入理解强化学习

强化学习Q-Learning Python可视化代码训练智能体移动到目标点 Pygame

Hands-On-Q-Learning-with-Python:Packt发行的《动手Q-Learning with Python》

Q_learning_Qlearning_Q算法_Q学习算法_Q-learning_q学习

GAN-Q-Learning:实施GAN Q学习https

基于Q-Learning算法的建筑能耗预测

q-learning.rar_Q-learning_Q——learning_matlab q-learning_q learni

Q-LEARNING 算法在控制倒立摆的应用

【强化学习】Q-Learning算法详解

Q-learning_q-learningmatlab_联合开发_路径规划_三维路径规划_q学习

深度学习算法 Q-learning 原理

Deep-QLearning-Agent-for-Traffic-Signal-Control:深入的Q-Learning强化学习代理尝试在交叉路口选择正确的...

边做边学深度强化学习：PyTorch程序设计实践迷宫 Q-Learning

推荐文章